AI资讯新闻榜单内容搜索- LLM

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: LLM

大模型融合！最新「进化算法」全自动组合开源模型，刷榜多项基准测试

大模型融合！最新「进化算法」全自动组合开源模型，刷榜多项基准测试

大模型融合！最新「进化算法」全自动组合开源模型，刷榜多项基准测试

自动将不同开源模型进行组合，生成具有新能力的新模型，Sakana AI开发的新方法做到了！

来自主题: AI技术研报

7239 点击 2024-04-08 16:25

企业内部如何更好落地大模型？我们走访了 10+ 先行者

企业内部如何更好落地大模型？我们走访了 10+ 先行者

企业内部如何更好落地大模型？我们走访了 10+ 先行者

在微软推出 Copilot 后，工作场景中如何落地 LLM 很快成为业内关注的重点。钉钉、飞书等办公软件也快速在最新版本中集成 AI 功能。对于软件企业而言，在已有的软件上增加 AI 功能，并带来新产值，已经被 Notion、多邻国等产品所验证。除此之外，在企业生产场景中，集成 LLM 的能力，并为企业组织赋能，也成为人们关注 AI 落地的一个视角。

来自主题: AI资讯

7829 点击 2024-04-03 11:43

如何从头开始编写LoRA代码，这有一份教程

如何从头开始编写LoRA代码，这有一份教程

如何从头开始编写LoRA代码，这有一份教程

作者表示：在各种有效的 LLM 微调方法中，LoRA 仍然是他的首选。LoRA（Low-Rank Adaptation）作为一种用于微调 LLM（大语言模型）的流行技术，最初由来自微软的研究人员在论文《 LORA: LOW-RANK ADAPTATION OF LARGE LANGUAGE MODELS 》中提出。

来自主题: AI技术研报

7891 点击 2024-03-20 16:16

当prompt策略遇上分治算法，南加大、微软让大模型炼成「火眼金睛」

当prompt策略遇上分治算法，南加大、微软让大模型炼成「火眼金睛」

当prompt策略遇上分治算法，南加大、微软让大模型炼成「火眼金睛」

近年来，大语言模型（LLMs）由于其通用的问题处理能力而引起了大量的关注。现有研究表明，适当的提示设计（prompt enginerring），例如思维链（Chain-of-Thoughts），可以解锁 LLM 在不同领域的强大能力。

来自主题: AI资讯

6299 点击 2024-03-11 17:28

怎么劝ChatGPT干活效果最好？我们尝试了100种方法，有图有真相

怎么劝ChatGPT干活效果最好？我们尝试了100种方法，有图有真相

怎么劝ChatGPT干活效果最好？我们尝试了100种方法，有图有真相

在 ChatGPT API 中，系统提示是一项很有亮点的功能，它允许开发人员控制 LLM 输出的「角色」，包括特殊规则和限制。系统提示中的命令比用户输入提示中的命令要有效得多，这让开发人员拥有了更大的发挥空间，而不是像现在使用 ChatGPT 网页应用程序和移动应用程序那样仅仅使用用户提示。

来自主题: AI技术研报

6135 点击 2024-03-10 16:13

田渊栋等人新作：突破内存瓶颈，让一块4090预训练7B大模型

田渊栋等人新作：突破内存瓶颈，让一块4090预训练7B大模型

田渊栋等人新作：突破内存瓶颈，让一块4090预训练7B大模型

3 月 6 日，田渊栋又一项研究出炉，这次，他们主攻 LLM 内存效率。除了田渊栋本人，还有来自加州理工学院、德克萨斯大学奥斯汀分校以及 CMU 的研究者。

来自主题: AI技术研报

11408 点击 2024-03-08 15:07

全面超越ViT，美团、浙大等提出视觉任务统一架构VisionLLAMA

全面超越ViT，美团、浙大等提出视觉任务统一架构VisionLLAMA

全面超越ViT，美团、浙大等提出视觉任务统一架构VisionLLAMA

半年多来，Meta 开源的 LLaMA 架构在 LLM 中经受了考验并大获成功（训练稳定、容易做 scaling）。

来自主题: AI技术研报

5086 点击 2024-03-07 14:01

进我的收藏夹吃灰吧：大模型加速超全指南来了

进我的收藏夹吃灰吧：大模型加速超全指南来了

进我的收藏夹吃灰吧：大模型加速超全指南来了

2023 年，大型语言模型（LLM）以其强大的生成、理解、推理等能力而持续受到高度关注。然而，训练和部署 LLM 非常昂贵，需要大量的计算资源和内存，因此研究人员开发了许多用于加速 LLM 预训练、微调和推理的方法。

来自主题: AI技术研报

4506 点击 2024-02-09 14:05

打破MoE训练效率与性能瓶颈，华为盘古稀疏大模型全新架构LocMoE出炉

打破MoE训练效率与性能瓶颈，华为盘古稀疏大模型全新架构LocMoE出炉

打破MoE训练效率与性能瓶颈，华为盘古稀疏大模型全新架构LocMoE出炉

2023 年 12 月，首个开源 MoE 大模型 Mixtral 8×7B 发布，在多种基准测试中，其表现近乎超越了 GPT-3.5 和 LLaMA 2 70B，而推理开销仅相当于 12B 左右的稠密模型。为进一步提升模型性能，稠密 LLM 常由于其参数规模急剧扩张而面临严峻的训练成本。

来自主题: AI技术研报

11113 点击 2024-02-04 13:59

Meta官方的Prompt工程指南：Llama 2这样用更高效

Meta官方的Prompt工程指南：Llama 2这样用更高效

Meta官方的Prompt工程指南：Llama 2这样用更高效

随着大型语言模型（LLM）技术日渐成熟，提示工程（Prompt Engineering）变得越来越重要。一些研究机构发布了 LLM 提示工程指南，包括微软、OpenAI 等等。

来自主题: AI技术研报

7345 点击 2024-01-29 12:36

上一页当前第22页,共24页下一页